Objetivo

Analizar la performance de la técnica de espectrometría de masa MALDI-TOF-MS (Matrix Assisted Laser Desorption Ionization – Time of Flight – Mass Spectrometry) como una metodología de diagnóstico molecular alternativa para COVID-19. El análisis de los espectros se hará con el software libre R en una estrategia de machine learning y con la integración de esta estrategia en una plataforma web de libre acceso. Este desarrollo podría complementar con precio y complejidad bajos, la demanda de determinaciones diagnósticas en esta situación de crisis sanitaria mundial.

Materiales y métodos

Procedimiento


  1. Nasopharyngeal swabs (1µl)

  2. Metal plate (Electrode)

  3. 1µl of Alfa-cyano-4-hydroxycinnamic acid matrix (HCCA) (Sigma). (0.2 dollars /spot ~ 20 dollars/Electrode)

  4. 30 minutes UV.

  • Time consuming for: 1+2+3+4 for 98 spots ~ 1 hour and a half
  1. Microflex LT mass spectrometer (Brüker)

  2. Raw mass spectrum (flexControl 3.4.135.0. Brüker)

  3. Mass spectra files (.mzML)

  • Time consuming for: 5+6+7 for 98 spots ~ 1 hour and a half
  1. Upload and process spectra in CovidClin_MS (5 minutes for 98 spots)

Análisis de datos

Algoritmos de Machine learning


  • El esquema de trabajo seleccionado para el estudio de clasificación, consiste en el uso del paradigma machine learning (una rama de la inteligencia artificial). Este implica entrenar y testear modelos de clasificación en sets de datos aleatoriamente generados. Los distintos algoritmos de clasificación seleccionan señales espectrales diferenciales entre los grupos en cuestión (entrenamiento) aprendiendo a diferenciar las categorías en función de las características de las mismas (picos del espectro). Luego se testea ese aprendizaje en un set de datos testigo (testeo) y posteriormente en set de datos de validación (ciegos). El software libre RStudio fue el seleccionado para implementar dichos algoritmos de machine learning. Por último, estos algoritmos se pueden hacerse accesibles al público mediante distintas plataformas, para este trabajo se seleccionaron plataformas web.

  • El esquema de clasificación consiste en primera medida aplicar el modelo que diferencia Cov.Pos de Cov.Neg, luego sobre cada conjunto se aplica el modelo Cov.Pos/Flu.Pos y Cov.Neg/Flu.Pos, respectivamente. Resultados posibles:

  1. Cov.Pos + Cov.Pos = Cov.Pos y Flu.Neg

  2. Cov.Pos + Flu.Pos = Cov.Neg y Flu.Pos

  3. Cov.Neg + Flu.Pos = Cov.Neg y Flu.Pos

  4. Cov.Neg + Flu.Neg = Cov.Neg y Flu.Neg

Resultados

Covid-19

Resultados preliminares Covid
Conjunto.de.datos Composición Exactitud Especificidad Sensibilidad NPV PPV
Datos Test.HC 13 Cov.Neg / 12 Cov.Pos 70.9 46.8 95 90.3 64.7
Datos.HC Validación.1 12 Cov.Neg / 6 Cov.Pos 72.2 58.3 100 100 54.5
Datos.HC Validación.2 6 Cov.Neg / 4 Cov.Pos 70 50 100 100 50
Datos.Malbrán Validación.1 11 Cov.Neg / 13 Cov.Pos 66.6 27.7 100 100 61.9
Datos.Malbrán Validación.2 14 Cov.Neg / 12 Cov.Pos 50 21.4 83.3 60 47.6

Influenza

Resultados preliminares Influenza
Conjunto.de.datos Composición Exactitud Especificidad Sensibilidad NPV PPV
Datos.HC Validación.1 12 Flu.Neg / 6 Flu.Pos 88.9 91.7 83.3 91.7 83.3
Datos.HC Validación.2 7 Flu.Neg / 3 Flu.Pos 90 87.5 100 100 66.7

CovidClin_MS